Exploitation de la morphologie pour l'extraction automatique de paraphrases grand public des termes médicaux
نویسندگان
چکیده
The medical area conveys very specific terms (p. ex., blepharospasm, appendicectomy), which are difficult to understand by people without medical training. We propose an automatic method for the acquisition of paraphrases, which we expect to be easier to understand than the original terms. The method is based on the morphological analysis of terms, syntactic analysis of texts, and text mining of non specialized texts. An analysis of the results and their evaluation indicate that such paraphrases can indeed be found and show easier understanding level. According to the setting of the method, precision of the extractions ranges between 90 and 7.4%. Such resources are useful for several NLP applications (p. ex., information retrieval, text simplification...). MOTS-CLÉS : domaines de spécialité, terminologie médicale, composition, analyse morphologique, paraphrase, compréhension.
منابع مشابه
Exploitation de l'asymétrie entre termes pour l'extraction automatique de taxonomies à partir de textes
Résumé. Nous présentons dans cet article une nouvelle approche pour la génération automatique de structures lexicales (ou taxonomies) à partir de textes. Cette tâche est fondée sur l’hypothèse forte selon laquelle l’accumulation de faits statistiques simples sur les usages en corpus permet d’approximer des informations de niveau sémantique sur le lexique. Nous utilisons la prétopologie comme ca...
متن کاملExtraction bilingue de termes médicaux dans un corpus parallèle anglais/français
Résumé. Le Catalogue et Index des Sites Médicaux Francophones (CISMeF) recense les principales ressources institutionnelles de santé en français. La description de ces ressources, puis leur accès par les utilisateurs, se fait grâce à la terminologie CISMeF, fondée sur le thésaurus américain Medical Subject Headings (MeSH). La version française du MeSH comprend tous les descripteurs MeSH, mais d...
متن کاملLa morphologie mathématique binaire pour l'extraction automatique des bâtiments dans les images THRS
RÉSUMÉ. Cet article présente une nouvelle méthode de détection et d’extraction des bâtiments en milieu urbain à partir d’images satellitaires à très haute résolution spatiale. L’approche proposée est fondée sur l’application et l’enchainement automatique d’opérateurs issus de la morphologie mathématique binaire. Plusieurs étapes constituent la méthode : (1) binarisation de l’image, (2) filtrage...
متن کاملThe impact of domains for Keyphrase extraction (Influence des domaines de spécialité dans l'extraction de termes-clés) [in French]
Résumé. Les termes-clés sont les mots ou les expressions polylexicales qui représentent le contenu principal d’un document. Ils sont utiles pour diverses applications, telles que l’indexation automatique ou le résumé automatique, mais ne sont pas toujours disponibles. De ce fait, nous nous intéressons à l’extraction automatique de termes-clés et, plus particulièrement, à la difficulté de cette ...
متن کاملApprentissage discriminant de modèles neuronaux pour la traduction automatique
RÉSUMÉ. Les méthodes utilisées pour entraîner des réseaux de neurones en traitement des langues reposent, pour la plupart, sur l’optimisation de critères qui sont décorrélés de l’application finale. Nous proposons un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles neuronaux en traduction automatique. Ce cadre s’appuie sur la définition d’un critère d’apprentissage qui p...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- TAL
دوره 57 شماره
صفحات -
تاریخ انتشار 2016